Korpus: guj_wikipedia_2011_100K

Weitere Korpora

3.6.2 Zipf's law for words of fixed lengths

Zipf distribution of words of fixed length 4, 6, 8, ..., 14.


Zipf's diagram for words of fixed length


Gnuplot diagram

Top Words of length 4
word rank frequency word
1 12047 માટે
2 7114 હતું
3 7002 સાથે
4 5563 ભારત
5 4851 રીતે
Top Words of length 6
word rank frequency word
1 7810 ભાગમાં
2 5708 દ્વારા
3 4524 પશ્ચિમ
4 4511 આવેલું
5 4083 ગુજરાત
Top Words of length 8
word rank frequency word
1 3343 મહત્વનું
2 1098 જિલ્લાના
3 706 પ્રકારના
4 652 પ્રકારની
5 589 યુનાઇટેડ
Top Words of length 10
word rank frequency word
1 654 વિસ્તારમાં
2 305 અમેરિકામાં
3 260 મહારાષ્ટ્ર
4 255 ક્ષેત્રમાં
5 238 ગ્રેગોરીયન
Top Words of length 12
word rank frequency word
1 137 પ્રતિનિધિત્વ
2 122 ઉત્તર પ્રદેશ
3 109 પ્રક્રિયામાં
4 98 સ્વામિનારાયણ
5 85 કેન્દ્રશાસિત
Top Words of length 14
word rank frequency word
1 61 ઓસ્ટ્રેલિયામાં
2 35 યુનિવર્સિટીમાં
3 33 પ્રકાશસંશ્લેષણ
4 31 સ્પ્રિન્ગસ્ટીન
5 28 લ્યુઇસિયાનામાં
Slope for length 4
Slope
-1.008972929966331
Slope for length 6
Slope
-0.9128282036069195
Slope for length 8
Slope
-0.7400034714785753
Slope for length 10
Slope
-0.7129843661361407
Slope for length 12
Slope
-0.7385606273598312
Slope for length 14
Slope
-0.6611096473669597
1097 msec needed at 2017-12-19 11:22